Národní úložiště šedé literatury Nalezeno 12 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Unsupervised Evaluation of Speaker Recognition System
Odehnal, Ondřej ; Plchot, Oldřich (oponent) ; Matějka, Pavel (vedoucí práce)
The context of this thesis is the state-of-the-art system for speaker identification (SID) based on the deep nerual network with x-vector embeddings. This thesis aims to propose and experimentally assess several techniques for evaluating the SID system using unlabelled datasets. For this purpose, discriminative embedding is created for every recording in the dataset. These embeddings are used to cluster the recordings and thus create pseudo-labels corresponding to different clusters. The SID system evaluation is based on equal error rate (EER), which uses these pseudo-labels. We proposed several unsupervised learning algorithms to achieve this; K-means, Gaussian mixture models (GMM), and agglomerative hierarchical clustering (AHC). After thorough testing, the K-means model with the Silhouette value showed the best results. This method achieved an estimate of 5.72 % EER with the reference EER equal to 5.15 % on SITW dev-core-core. Similar results were observed on the SITW eval-core-core, where the estimated EER is equal to 5.86 % and the reference 5.08 %. The difference between estimated and reference EER is 0.57 % for the dev-core-core and 0.78 % for the eval-core-core. Another series of experiments were conducted on NIST SRE16 and VoxCeleb1 to verify robustness of the proposed method. Generally, the developed testing process had an estimated error of around 1 % in all test databases, an excellent result for an unsupervised learning technique.
Aplikace pro demonstraci multi-biometrické fúze
Hanák, Jaroslav ; Hrubý, Martin (oponent) ; Mráček, Štěpán (vedoucí práce)
Tato práce je zaměřena na oblast biometrie, multi-biometrie, normalizace a fúze v multi-biometrických systémech a jejich hodnocení výkonnosti. Obsahuje stručný úvod do této problematiky a přehled používaných technik. Cílem práce je navrhnout a poté implementovat aplikaci demonstrující výkonnost systémů spadajících do kategorie multi-modálních biometrických systémů. Dále jsou popsány experimenty s databází šablon z multi-biometrického systému a v závěru jsou shrnuty dosažené výsledky.
Speaker Recognition in the VoIP Environment
Remeš, Jan ; Pešán, Jan (oponent) ; Plchot, Oldřich (vedoucí práce)
This work describes using speaker recognition systems in the VoIP environment, system performance and approaches to improving it. System architecture, evaluation metrics and VoIP technology key components from the view of speaker recognition are described. VoIP environment simulation is described. Speaker recognition system's performance is evaluated on data sets from various kinds of VoIP environments and the results are demonstrated. System adaptation and calibration is performed and their benefits are discussed.
Textově závislé rozpoznávání mluvčího
Fux, Jan ; Glembek, Ondřej (oponent) ; Matějka, Pavel (vedoucí práce)
Cílem této bakalářské práce bylo navrhnout systém pro textově závislé rozpoznávání mluvčího. Bylo otestováno několik přístupů na databázi MIT, která obsahuje nahrávky průměrné délky 0,46s. Z otestovaných přístupů se jeví jako nejlepší kombinace systému DTW s využitím odhadu posteriorních pravděpodobností fonémů (posteriogramu) jako výstupu z Fonémového rozpoznávače, a akustického SID systému založeného na iVektorech a PLDA (Probabilistic Linear Component Analysis). Fúze těchto dvou systémů pomocí Neuronové sítě dosahuje nejlepších výsledků (EER) a to 17,84% pro ženy a 16,38% pro muže, což je relativní zlepšení 49,9% u žen a 54,2% u mužů oproti samostatnému akustickému rozpoznávání.
Biometrie krevního řečiště prstu
Bělehrádek, Stanislav ; Sekora, Jiří (oponent) ; Mézl, Martin (vedoucí práce)
V této práci jsou uvedeny základní pojmy z oboru biometrie se zaměřením na biometrii krevního řečiště prstu optickými metodami. Práce obsahuje i doplňující informace mimo jiné i z fyziky a anatomie, které jsou důležité pro pochopení problematiky. Součástí práce je návrh přípravku pro biometrii krevního řečiště prstu a návrh vhodného způsobu předzpracování snímků žilního větvení. Praktickou částí je realizace navrženého přípravku a vytvoření programu v MATLABu pro biometrické zpracování získaných obrazů. Vytvořený biometrický systém je otestován na skupině dobrovolníků. Dosažené výsledky jsou zhodnoceny z hlediska možnosti praktického použití a srovnány s podobným zařízením.
Metoda dynamického borcení času
Černohous, Lukáš ; Pikula, Stanislav (oponent) ; Klusáček, Jan (vedoucí práce)
Tato práce se zabývá popisem metody dynamického borcení času (DTW), jejím principem, variantami a způsobem výpočtu. Dále vyjmenovává některé typické případy její implementace. V praktické části se zaměřuje na vytvoření jednoduchého modelu verifikace podpisu na bázi DTW, jehož výsledky následně zhodnocuje. Model byl naprogramován v MATLABu.
Unsupervised Evaluation of Speaker Recognition System
Odehnal, Ondřej ; Plchot, Oldřich (oponent) ; Matějka, Pavel (vedoucí práce)
The context of this thesis is the state-of-the-art system for speaker identification (SID) based on the deep nerual network with x-vector embeddings. This thesis aims to propose and experimentally assess several techniques for evaluating the SID system using unlabelled datasets. For this purpose, discriminative embedding is created for every recording in the dataset. These embeddings are used to cluster the recordings and thus create pseudo-labels corresponding to different clusters. The SID system evaluation is based on equal error rate (EER), which uses these pseudo-labels. We proposed several unsupervised learning algorithms to achieve this; K-means, Gaussian mixture models (GMM), and agglomerative hierarchical clustering (AHC). After thorough testing, the K-means model with the Silhouette value showed the best results. This method achieved an estimate of 5.72 % EER with the reference EER equal to 5.15 % on SITW dev-core-core. Similar results were observed on the SITW eval-core-core, where the estimated EER is equal to 5.86 % and the reference 5.08 %. The difference between estimated and reference EER is 0.57 % for the dev-core-core and 0.78 % for the eval-core-core. Another series of experiments were conducted on NIST SRE16 and VoxCeleb1 to verify robustness of the proposed method. Generally, the developed testing process had an estimated error of around 1 % in all test databases, an excellent result for an unsupervised learning technique.
Biometrie krevního řečiště prstu
Bělehrádek, Stanislav ; Sekora, Jiří (oponent) ; Mézl, Martin (vedoucí práce)
V této práci jsou uvedeny základní pojmy z oboru biometrie se zaměřením na biometrii krevního řečiště prstu optickými metodami. Práce obsahuje i doplňující informace mimo jiné i z fyziky a anatomie, které jsou důležité pro pochopení problematiky. Součástí práce je návrh přípravku pro biometrii krevního řečiště prstu a návrh vhodného způsobu předzpracování snímků žilního větvení. Praktickou částí je realizace navrženého přípravku a vytvoření programu v MATLABu pro biometrické zpracování získaných obrazů. Vytvořený biometrický systém je otestován na skupině dobrovolníků. Dosažené výsledky jsou zhodnoceny z hlediska možnosti praktického použití a srovnány s podobným zařízením.
Metoda dynamického borcení času
Černohous, Lukáš ; Pikula, Stanislav (oponent) ; Klusáček, Jan (vedoucí práce)
Tato práce se zabývá popisem metody dynamického borcení času (DTW), jejím principem, variantami a způsobem výpočtu. Dále vyjmenovává některé typické případy její implementace. V praktické části se zaměřuje na vytvoření jednoduchého modelu verifikace podpisu na bázi DTW, jehož výsledky následně zhodnocuje. Model byl naprogramován v MATLABu.
Speaker Recognition in the VoIP Environment
Remeš, Jan ; Pešán, Jan (oponent) ; Plchot, Oldřich (vedoucí práce)
This work describes using speaker recognition systems in the VoIP environment, system performance and approaches to improving it. System architecture, evaluation metrics and VoIP technology key components from the view of speaker recognition are described. VoIP environment simulation is described. Speaker recognition system's performance is evaluated on data sets from various kinds of VoIP environments and the results are demonstrated. System adaptation and calibration is performed and their benefits are discussed.

Národní úložiště šedé literatury : Nalezeno 12 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.